COMPASS: High-Efficiency Deep Image Compression with Arbitrary-scale Spatial Scalability

Jongmin Park, Jooyoung Lee, Munchurl Kim

ICCV 2023

Abstract

本研究提出了一种名为COMPASS的新型基于神经网络的空间可扩展图像压缩方法，支持任意尺度的空间可扩展性，通过采用一种称为LIFF的层间任意尺度预测方法，有效减少了相邻层之间的空间冗余，并提供了与单层编码相媲美甚至更好的编码效率。

Background

Abstract

论文背景: 随着多媒体应用的增长，图像压缩变得越来越重要。尽管神经网络（NN）基于图像压缩方法在编码效率方面取得了显著进展，但大多数现有方法仅支持非可扩展图像压缩，而空间可扩展图像压缩的研究相对较少。
过去方案: 传统的可扩展编码方法主要分为质量可扩展编码和空间可扩展编码。现有的NN-based方法主要集中在质量可扩展编码，而空间可扩展编码的研究相对较少。现有的NN-based空间可扩展编码方法中，只有一种固定的尺度因子被使用，限制了其在实际应用中的可行性。
论文的Motivation: 鉴于现有方法的局限性，本研究旨在提出一种新型的NN-based空间可扩展图像压缩方法，名为COMPASS，以支持任意尺度的空间可扩展性，并提高编码效率。

Method

a. 理论背景:
- COMPASS是一种基于神经网络的空间可扩展图像压缩方法，支持任意比例的空间可扩展性。它采用了一种称为LIFF的层间任意比例预测方法，以减少相邻层之间的冗余。实验结果表明，与现有方法相比，COMPASS在BD-rate方面取得了显著的增益，并且在各种比例因子下具有可比或更好的编码效率。
b. 技术路线:
- COMPASS是一种基于神经网络的图像压缩网络，具有任意比例的空间可扩展性。它使用LIFF方法将图像的多个版本编码为单个比特流。它还引入了一个组合的RD损失函数，用于有效训练多个层次。COMPASS相比现有方法显著提高了编码效率，并支持任意比例因子。

Experiment

例子

a. 详细的实验设置:
- 实验使用了不同的比例因子进行了多组实验，包括五组双层可扩展性和五组三层可扩展性。实验中使用的数据集和通道数与前一节中的相同。
b. 详细的实验结果:
- 表1显示了COMPASS在BD-rate方面与其他方法的编码效率性能对比。除了单层（均值比例）方法外，COMPASS优于所有空间可扩展编码方法。与使用相同图像压缩模块的Mei等人的增强版本相比，COMPASS在各种比例因子下实现了-14.23%的BD-rate增益。在参数方面，COMPASS的参数比Mei等人的方法少。与SHVC在不同层次上相比，COMPASS也显示出显著的BD-rate增益。
- 对于任意比例因子，COMPASS实现了高编码效率。表2显示了双层可扩展编码的比较结果，其中COMPASS优于所有空间可扩展编码方法，甚至与使用均值比例模型的单层编码实现了可比较的结果。对于三层可扩展编码，除了4.0×比例因子外，COMPASS也优于所有空间可扩展编码方法，并展示了对单层编码的优越性。
- 图6显示了COMPASS与其他方法在相邻层之间比例因子为2的三层可扩展编码的视觉比较结果。COMPASS的重构图像在主观质量方面明显更好，特别是在边缘和纹理等高频成分方面。
- 通过消融研究验证了COMPASS中所提出元素的有效性。结果表明，完整的COMPASS模型明显优于消融模型，表明每个提出的元素都有助于提高编码效率。